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融合 新 兴 领 域 知识 融合 
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摘要 : [目的 /意义 ] 技 术 融 合 是 新 兴 产 业 形 成 和 发 展 的 驱动 力 ,而 知识 融合 是 技术 融合 的 前 提 ,， 对 知识 融 
合 过 程 进行 研究 ,对 于 引导 新 兴 产 业 形 成 和 发 展 具 有 重要 意义 。[ 方 法 /过 程 ] 首先 根据 现 有 的 研究 构建 一 个 采 
用 论文 引用 网 络 表征 知识 融合 过 程 的 理论 模型 ,其 次 根据 知识 融合 过 程 每 个 阶段 论文 引用 网 络 的 特征 设计 验 
证 方法 ,最 后 以 融合 新 兴 生 物 信 息 领域 为 例 进行 实证 分 析 。[ 结果 /结论 ] 生物 信息 领域 的 实证 分 析 结 果 表 明理 
论 模型 的 有 效 性 ,可 为 研究 知识 融合 过 程 提供 一 种 新 的 方法 。 
v 关键 词 : 知识 融合 ”知识 流动 ”引用 网 络 新 兴 领 域 
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加 新 兴 技 术 是 我 国 创新 驱动 发 展 的 重要 着 力 点 , 引 
感 恬 展 新 兴 技 术 对 我 国 抢占 未 来 经 济 和 科技 制高点 ， 
走 4D 创 新 驱动 .持续 发 展 的 轨道 具有 重大 意义 。 新 兴 
找 谭 的 形成 与 发 展 存在 多 种 路 径 ", 其 中 技术 融合 作 
为 靳 兴 技 术 产生 与 发 展 的 一 个 新 的 决定 性 因素 引发 了 
太医 的 关注 和 研究 中。 科学 客观 地 分 析 技 术 融 合 过 程 
对 中 引导 新 兴 技 术 的 形成 和 发 展 具有 重要 意义 。 

:在 F. Hacklin 提出 的 技术 融合 的 演化 框架 中 , 知 
识 郁 合 是 技术 融合 的 前 提 " ,并 驱动 了 新 兴 技术 的 形 
成 和 发 展 “"。 在 知识 融合 的 发 展 过 程 中 ,会 出 现 不 同 
于 原 有 科学 领域 的 知识 外 溢 。 这 种 知识 外 洪 往 往 发 生 
在 现 有 科学 领域 之 间 , 随 着 知识 外 溢 程 度 的 不 断 加 深 ， 
新 的 研究 范式 出 现 , 原 有 的 科学 领域 便 经 知识 融合 产 
生 新 的 科学 领域 以 获得 新 的 功能 或 效率 改善 ,最 终 导 
致 技术 融合 的 出 现 ””。 如 融合 新 兴 领 域 生物 信息 的 
形成 ,生物 科学 领域 起 初 多 采用 实验 观测 法 进行 研究 ， 
但 随 着 观测 数据 的 不 断 增多 ,研究 者 在 19 世纪 70 年 
代 开 始 将 信息 科学 的 知识 和 方法 应 用 于 生物 科学 领 
域 。 随 着 生物 科学 与 信息 科学 之 间 的 知识 外 溢 不 断 加 


深 , 并 逐渐 形成 一 种 不 同 于 生物 科学 和 信息 科学 领域 
研究 范式 的 一 种 新 的 研究 范式 ,新 的 研究 范式 的 出 现 
表明 了 生物 信息 领域 的 产生 

现 有 知识 融合 和 技术 融合 的 研究 多 通过 预测 融合 
的 出 现 和 采用 指标 对 融合 现象 进行 截面 研究 。 一 些 研 
究 采 用 定性 研究 方法 来 分 析 融 合 现象 ,如 我 国 的 赵 红 
州 提 出 一 种 科学 发 现 的 采掘 模型 来 解释 技术 演化 过 程 
出 现 的 交叉 融合 “7 ,E. Leon 基于 专家 知识 提出 了 一 
种 预测 融合 出 现 方法  。 另 外 一 些 研 究 则 采用 基于 数 
据 指标 的 定量 研究 方法 ,如 有 R. Kong 等 通过 计算 两 种 领 
域 之 间 相 似 度 衡量 领域 间 融 合 程度 ”,H. Park 等 也 提 
出 了 基于 IPC 分 类 的 各 项 指标 识别 分 析 领 域 间 融 合 状 
态 的 算法 "'”。 最 近 一 些 学 者 开始 采用 聚 类 方法 和 专 
利 引 用 网 络 相 结合 的 方法 '""。 现 有 的 研究 能 够 有 效 
地 从 一 个 或 多 个 方面 识别 知识 融合 和 技术 融合 的 状 
态 , 然 而 无 法 有 效 地 描述 和 研究 知识 融合 的 具体 演化 
过 程 。 

论文 是 科学 知识 的 载体 与 交流 的 媒介 " ,论文 
间 的 引用 过 程 是 在 前 人 知识 的 基础 上 进行 知识 选择 、 
进化 .传播 和 应 用 的 过 程 '“ ,论文 间 的 相互 引用 关系 
则 反映 了 知识 的 流动 过 程 5 。 论 文 引 用 网 络 是 以 论 


* 本 文系 国家 自然 科学 基金 项 目 “ 支 持 技术 预见 的 多 源 异 构 大 数据 融合 与 时 序 文本 预测 方法 研究 ”( 项目 编号 :91646102 ) 和 国家 自然 科学 基 
金 项 目 “ 面 向 2035 的 中 国 工程 科技 发 展 路 线 图 绘制 理论 与 方法 研究 ”( 项 目 编号 :L1624045 ) 研究 成 果 之 一 。 

作者 简介 : 周 源 (ORCID :0000 -0002 -9198 —6586) ,副教授 ,博士 ,博士 生 导 师 ; 董 放 (ORCID :0000 -0003 -4271 -9702 ) ,博士 研究 生 ; 刘 宇 飞 
( ORCID :0000 — 0001 -9420 -8811) ,博士 后 ,通讯 作者 ，E-mail:liuyufei0418@dqdq. com, 

收 稿 日 期 :2018 -06 -11 修 回 日 期 :2018 -12-25 本 文 起 止 页 码 :127 -134 本 文责 任 编辑 : 杜 杏 叶 


127 


AELE xt 


第 63 卷 第 8 期 2019 ££ A H 


ChinaXiv 合 作 期 刊 


文 为 节点 .论文 间 的 引用 关系 为 连接 的 网 络 ,其 能 够 反 
映 大 数据 量 下 复杂 的 知识 流动 ,是 研究 知识 融合 过 程 
中 知识 流动 的 有 效 工具 。 在 对 科学 领域 进行 描述 时 ， 
L Sakata 指出 论文 引用 网 络 是 一 种 相 比 于 语义 分 析 更 
为 有 效 的 方法 25 。 根 据 Y. Kajikawa 与 M. Newman 等 
人 的 研究 结果 "中 ,拓扑 聚 类 的 方法 可 以 根据 论文 引 
用 网 络 中 论文 节点 的 聚集 程度 将 论文 引用 网 络 划分 为 
多 个 复 团 ,其 中 每 个 簇 团 均 对 应 于 一 个 科学 领域 ,结合 
网 络 可 视 化 则 能 够 直观 地 展示 出 领域 的 分 布 状态 和 演 
化 过 程 ,是 描述 科学 领域 及 其 变化 的 有 效 方法 。 因 此 ， 
相 比 于 现 有 的 融合 状态 描述 的 方法 ,本 文采 用 引用 网 
络 可 视 化 与 拓扑 聚 类 相 结合 的 方法 分 析 了 知识 融合 的 
整个 过 程 。 
一 本文 首先 梳理 了 知识 流动 和 领域 描述 方面 的 研 
究 鲍 建 了 一 个 采用 论文 引用 网 络 表征 知识 融合 过 程 
的 理论 模型 ;然后 设计 了 理论 模型 的 验证 方法 ,并 在 融 
合租 兴 领 域 一 生物 信息 领域 进行 实证 分 析 ; 最 终 根 
握 对 证 分 析 结果 完成 对 理论 模型 的 验证 和 完善 。 本 文 
所 构建 的 知识 融合 过 程 理论 模型 提供 了 一 种 新 的 研究 
知 汉 融合 过 程 的 方法 ,能 够 为 科研 人 员 研 究 融合 新 兴 
R 域 的 形成 与 发 展 过 程 提供 一 定 的 帮助 。 


[ 


20 知识 融合 理论 概述 


CN. Rosenberg 首次 提出 技术 融合 这 一 概念 , 技 
术 柄 合并 非 技 术 层面 的 单一 .孤立 的 现象 ,在 其 产生 和 
发 感 过 程 中 ,需要 相关 基础 科学 .应 用 科学 为 技术 融合 
提供 重要 支持 , 与 社会 经 济 ` 法 律 规 则 等 关系 密 
切 补 -2 。 技 术 融 合 整个 过 程 分 为 知识 融合 、 技 术 融 
合 市场 融合 和 产业 融合 四 个 时 间 阶 段 ,其 中 知识 融合 
是 技术 融合 的 前 提 '™  。 在 理想 的 技术 融合 过 程 中 , 知 
识 融合 结束 技术 融合 随 之 产生 并 促使 新 的 产品 与 市 场 
的 结合 进而 导致 市 场 融合 的 产生 以 及 企业 间 合并 ,最 
终 完成 产业 融合 中 。 

知识 融合 对 应 于 技术 融合 存在 两 种 形式 ,如 图 1 
所 示 ,前 一 种 形式 为 两 种 科学 领域 (A 和 了 B) 融 合 形成 
新 的 科学 领域 (C) ,此 时 原 有 的 科学 领域 依然 存在 ( 简 
称 A+B=A+B+C 型 ); 后 一 种 形式 为 两 种 科学 领域 
(A 和 了 ) 融 合 互补 形成 新 的 科学 领域 并 替换 掉 原 有 的 
科学 领域 (AB)” (简称 A+B= AB 型 ) 。 本 文 所 构建 
的 采用 论文 引用 网 络 表征 知识 融合 过 程 的 理论 模型 只 
针对 A+B=A+B+C 形 式 的 知识 融合 。 


128 


图 1 两 种 不 同 的 知识 融合 形式 


2.2 知识 融合 过 程 理论 模型 

知识 融合 整个 过 程 伴 随 着 活跃 的 知识 流动 并 会 形 
成 新 的 科学 领域 , 现 有 的 研究 指出 知识 融合 过 程 开始 
于 两 个 不 同 科学 领域 间 的 知识 流动 , 随 着 领域 间 的 知 
识 流动 逐渐 加 深 ,最 终 当 形成 新 的 研究 范式 则 表明 融 
合 领 域 的 形成 *”。 具 体 来 说 ,知识 融合 的 过 程 则 是 
从 现 有 科学 领域 按照 各 自 的 研究 范式 独立 发 展 ,到 原 
有 的 科学 领域 间 出 现 知识 流动 ,最 终 形成 新 的 融合 领 
域 的 过 程 。 因 此 ,本 文采 用 论文 引用 网 络 中 的 不 同 科 
学 领域 间 相 互 引 用 表征 科学 领域 间 的 知识 流动 ,采用 
论文 引用 网 络 经 拓扑 聚 类 后 簇 团 的 变化 表征 融合 过 程 
中 科学 领域 的 变化 ,最 终 构建 了 一 个 基于 论文 引用 网 
络 表征 的 知识 融合 过 程 的 理论 模型 ,如 图 2 所 示 : 


图 2 知识 融合 过 程 理论 模型 


基于 论文 引用 网 络 表 征 的 知识 融合 理论 模型 将 知 
识 融合 过 程 划分 为 以 下 3 个 阶段 : 

阶段 1: 科 学 领域 A.B 在 阶段 1 均 按照 各 自 的 研 
究 范 式 发 展 ,其 中 的 知识 流动 为 科学 领域 A.B 各 自 领 
域内 的 知识 流动 ,此 时 论文 引用 网 络 中 的 相互 引用 关 
系 则 主要 为 各 自 领 域内 论文 间 的 相互 引用 ,论文 引用 
网 络 经 拓扑 聚 类 划分 后 的 篮 团 也 仅 存在 领域 A 所 对 应 
的 篮 团 和 领域 B 所 对 应 的 篮 团 。 阶 段 1 见 图 2。 

阶段 2: 科 学 领域 A、B 在 阶段 2 研究 范式 间 出 现 
交叉 渗透 ,其 中 科学 领域 A、B 开始 出 现 领域 间 的 知识 
流动 ,但 在 该 阶段 并 未 形成 新 的 融合 领域 ,论文 引用 网 
络 经 拓扑 聚 类 划分 后 的 篮 团 也 仅 存 在 领域 A 所 对 应 的 
篮 团 和 领域 B 所 对 应 的 篮 团 ,并 未 出 现 融合 领域 所 对 
应 的 簇 团 。 阶 段 2 见 图 2。 
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阶段 3: 科 学 领域 A.B 在 阶段 3 经 知识 融合 新 的 
研究 范式 开始 形成 ,标志 着 融合 领域 的 出 现 ,此 时 论文 
引用 网 络 经 拓扑 聚 类 划分 后 的 复 团 除了 领域 A、B 所 
对 应 的 簇 团 之 外 ,融合 领域 所 对 应 的 新 簇 团 开始 出 现 ， 
本 文中 称 融合 领域 对 应 的 簇 团 为 融合 簇 团 。 阶 段 3 见 
图 2。 


3 ”知识 融合 过 程 理论 模型 验证 方法 

3.1 ”验证 方法 总 体 框架 

知识 融合 过 程 理论 模型 验证 方法 是 基于 知识 融合 
程 理论 模型 建立 的 。“ 知 识 融 合 过 程 理 论 模型 是 否 


— 


实际 知识 融合 过 程 ”， 知 识 融 合 过 程 的 理论 模型 
完善 ”这 两 个 问题 是 该 验证 方法 所 要 解决 的 问 
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一 知识 融合 过 程 理论 模型 验证 方法 总 体 框架 分 为 以 


步骤 1: 论 文 引用 网 络 构建 。 首 先 制定 所 研究 领 
域 的 检索 式 ,然后 依据 检索 式 从 论文 数据 库 中 检索 出 
橱 议 的 论文 数据 集 ,之 后 提取 论文 数据 集中 论文 间 的 
阴 搓 引用 信息 ,最 终 完成 论文 引用 网 络 的 构建 。 
中 步骤 2: 论 文 引用 网 络 分 析 。 分 别 采用 可 视 化 广 
法 注 别 跨 领 域 引用 ,拓扑 聚 类 方法 识别 融合 簇 团 ,LDA 
主题 模型 提取 徐 团 主题 词 ,从 跨 领 域 引用 ,融合 簇 团 ， 
钢 看 主题 词 3 个 方面 分 析 所 建立 论文 引用 网 络 的 特 
libe 
-二 步骤 3 :知识 融合 状态 识别 。 根 据 论文 数据 集 时 
闻 医 间 中 每 年 的 论文 引用 网 络 在 跨 领域 引用 ,融合 艇 
团 , 簇 团 主题 词 3 个 方面 的 特征 ,首先 划分 知识 融合 过 
程 的 阶段 ,之 后 识别 融合 徐 团 的 研究 主题 ,最 终 完成 知 
识 融 合 过 程 理论 模型 的 验证 和 完善 。 
3.2 ”论文 引用 网 络 构建 

在 本 文中 ,选取 汤 森 路 透 的 Web of Science( WOS) 
论文 数据 库 作为 论文 数据 源 , 数 据 库 具体 选择 WOS 中 
的 SCI- EXPANDED,SSCI, A & HCI 数据 库 , 这 三 个 数 
据 库 包 含 数 千 种 学 术 期 刊 且 引用 信息 完备 ,是 进行 引 
用 信息 提取 最 有 效 的 数据 库 ” 。 在 进行 论文 数据 检 
索 时 ,分 别 选取 科学 领域 A.B 的 若干 关键 词 来 表示 该 
科学 领域 ,根据 每 个 领域 的 关键 词 制定 检索 式 在 WOS 
中 检索 ,从 而 获得 科学 领域 A、B 的 论文 数据 集 。 为 了 
准确 的 分 析 科学 领域 A、B 知识 融合 的 过 程 , 需 确保 科 
学 领域 A B 检索 的 数据 具有 相同 的 终止 时 间 , 且 重合 
的 时 间 跨 度 尽 可 能 的 长 。 由 于 直接 引用 关系 更 能 反映 
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理论 模型 验证 结果 


3 ”验证 方法 总 体 框架 


知识 流动 和 论文 的 聚集 特征 ,因此 采用 Java 语言 解 
析 科 学 领域 A.B 全 部 论文 数据 集中 论文 间 的 直接 引 
日 信息 ,以 论文 作为 节点 ,直接 引用 关系 为 连接 构建 论 
文 引用 网 络 。 
3.3 论文 引用 网 络 分 析 

根据 知识 融合 过 程 的 理论 模型 ,知识 融合 过 程 在 
不 同 的 阶段 分 别 在 论文 引用 网 络 中 的 跨 领域 引用 数 
量 , 是 否 存在 融合 徐 团 以 及 簇 团 主题 词 3 个 方面 表现 
出 不 同 的 特征 ,因此 分 析 论 文 引用 网 络 中 这 3 个 方面 
的 特征 是 知识 融合 状态 识别 的 前 提 同 时 也 是 验证 方法 
的 关键 。 
3.3.1. 跨 领 域 引用 识别 ” 跨 领 域 引用 识别 是 对 论文 
引用 网 络 中 分 别 属于 不 同 科学 领域 论文 间 的 相互 引用 
关系 进行 识别 。 不 同 科学 领域 论文 间 的 相互 引用 反映 
了 知识 融合 过 程 中 领域 间 的 知识 流动 ,在 本 文中 根据 
论文 引用 网 络 的 可 视 化 结果 来 识别 论文 间 跨 领域 引用 
的 数量 。 在 可 视 化 显示 论文 引用 网 络 时 ,通过 不 同 的 
颜色 来 区 分 引用 网 络 中 节点 和 连接 的 类 别 ,其 中 节点 
根据 论文 所 属 科 学 领域 的 不 同 采 用 两 种 不 同 的 颜色 显 
示 ; 连 接 的 颜色 根据 连接 两 端 论文 节点 的 类 别 确定 , 当 
两 个 节点 同属 一 个 科学 领域 时 节点 间 连 接 的 颜色 与 该 
领域 论文 节点 的 颜色 相同 , 当 两 个 节点 所 属 科学 领域 
不 同时 , 则 节点 间 连 接 的 颜色 显示 为 白色 。 基 于 上 述 
可 视 化 方法 开发 了 论文 引用 网 络 可 视 化 软件 Citation- 
Network Data Analyzer( CDA ) , 见 图 4。 采 用 CDA 软件 
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检测 论文 引用 网 络 中 是 否 存在 白色 连接 ,存在 白色 连 
接 即 论文 引用 网 络 中 存在 论文 间 跨 领域 引用 。 


图 4 CitationNetwork Data Analyzer 界面 


3G BERARI MARARA ANA 
Hi 7E Jt D 39 FEE E VEL , AT RITE AIRE 
UU. L Rafols 在 综述 跨 学 科研 究 中 的 文献 计量 方法 
时 玫 出 技术 多 样 性 的 均匀 度 可 以 反映 学 科 融 合 的 程 
度 当 。 李 了 站 基 于 技术 多 样 性 的 均匀 度 实证 分 析 了 
栈 合 产业 生物 芯片 产业 的 产生 ,类 岩 在 以 信息 技术 
与 电动 汽车 技术 的 融合 为 例 综述 融合 的 测度 方法 时 提 
:的 对 多 个 基于 技术 多 样 性 均匀 度 的 融合 测度 指标 1。 
知 训 多 样 性 的 均匀 程度 更 高 的 复 团 表明 其 包含 的 论文 
囊 多 地 来 自 于 不 同 的 领域 ,基于 技术 多 样 性 的 均匀 度 ， 
本 锋 通 过 计算 徐 团 中 每 个 领域 论文 占 比 快速 直观 地 描 
述 诅 敌 团 知识 多 样 性 的 均匀 程度 。 融 合 复 团 的 识别 
首 顷 采用 拓扑 聚 类 的 方法 提取 出 论文 引用 网 络 中 的 
全 部 复 团 ,拓扑 聚 类 能 够 根据 引用 网 络 节点 间 的 聚 
集 特征 将 网 络 划 分 为 多 个 徐 团 ,效果 见 图 5。 在 本 文 
中 选用 Newman 聚 类 算法 来 实现 论文 引用 网 络 的 拓 
扑 聚 类 过 程 , 该 算法 相 比 于 其 他 聚 类 算法 无 需 指定 
聚 类 饶 的 数量 ,而 是 按照 节点 间 的 聚集 特征 自动 将 
引用 网 络 划分 为 最 优 数 量 的 簇 团 ”。 在 提取 出 全 部 
的 簇 团 之 后 ,分 析 每 个 徐 团 中 所 包含 两 个 科学 领域 
论文 的 比例 ,其 中 均匀 包含 两 个 科学 领域 的 徐 团 即 
为 融合 簇 团 。 

3.3.3 ” 徐 团 主题 词 提取 ”融合 簇 团 对 应 于 知识 融 
所 形成 的 新 的 融合 领域 ,为 了 确定 该 科学 领域 的 研 
主题 ,采用 主题 词 提取 的 方法 提取 融合 簇 团 中 包含 
文 的 主题 词 ,并 通过 主题 词 来 描述 该 科学 领域 的 研 
主题 。 在 本 文中 采用 LDA 主题 模型 来 实现 徐 团 主题 
词 提取 的 过 程 ,LDA 主题 模型 是 自然 语言 处 理 中 一 种 
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图 5 拓扑 聚 类 簇 团 划分 


常用 的 非 监 督 主题 提取 方法 ,其 基本 思想 是 描述 文档 
的 主题 概率 分 布 进而 描述 单词 的 主题 概率 分 布 。 本 文 
采用 LDA 主题 模型 提取 主题 词 时 ,不 考虑 主题 词 在 不 
同 主题 下 的 分 布 ,因此 选择 主题 数 为 K=1 的 LDA 主 
题 模 型 对 论文 题目 进行 主题 词 提 取 ,LDA 主题 模型 中 
的 先 验 超 参数 a 和 B ARAME a = 50/K ,B = 
0.01( 即 w = 50,8 = 0.01,3k (CUL 1 000 次 )。 
3.4 知识 融合 状态 识别 
本 文 所 构建 的 基于 论文 引用 网 络 表征 的 知识 融合 
过 程 理论 模型 将 知识 融合 过 程 划 分 为 3 个 阶段 。 知 识 
融合 状态 识别 即 根据 实证 案例 某 一 年 份 论文 引用 网 络 
中 是 否 存 在 跨 领域 引用 、 是 否 存 在 融合 簇 团 、 徐 团 主题 
词 3 个 方面 的 特征 确定 该 年 份 所 处 知识 融合 的 阶段 。 
表 !1 为 知识 融合 过 程 各 个 阶段 在 论文 引用 网 络 中 是 否 
存在 跨 领域 引用 ,是 否 存在 融合 簇 团 、 融 合 簇 团 主题 词 
3 个 方面 的 特征 。 
表 1 知识 融合 过 程 各 阶段 融合 状态 识别 


阶段 状态 特征 

阶段 1 JRA A B 间 不 存在 论文 的 跨 领域 引用 ; 簇 团 均 为 原 有 科 
学 领域 对 应 的 簇 团 

阶段 2 原 有 领域 A、B 间 存 在 论文 的 跨 领域 引用 ; 簇 团 均 为 原 有 科学 
领域 对 应 的 簇 团 

阶段 3 原 有 领域 A、B 间 存 在 论文 的 跨 领域 引用 ; 簇 团 除 了 原 有 科学 
领域 对 应 的 篮 团 之 外 存在 融合 复 团 ,融合 禾 团 论文 主题 词 属 于 


融合 领域 


通过 识别 分 析 实 证 案例 每 年 知识 融合 的 状态 特征 
并 结合 阶段 划分 结果 对 所 构建 的 理论 模型 进行 验证 。 
当 实 证 案例 按照 其 每 年 论文 引用 网 络 的 特征 可 以 被 划 
分 为 理论 模型 中 的 3 个 阶段 且 在 每 个 阶段 符合 上 述 理 
论 模 型 中 各 阶段 的 状态 特征 时 说 明 本 文 所 构建 的 知识 
融合 过 程 理论 模型 符合 实际 的 知识 融合 过 程 。 由 于 本 
文 所 构建 的 理论 模型 是 根据 现 有 的 理论 推导 而 来 , 实 
际 的 知识 融合 过 程 要 比 理论 模型 复杂 很 多 ,因此 根据 
实证 案例 在 知识 融合 过 程 各 阶段 所 观察 到 其 它 特 征 对 
提出 的 理论 模型 进行 完善 。 


AR, EA, 刘 宇 飞 . 融合 新 兴 领 域 知 识 融 合 过 程 研究 


以 生物 信息 领域 为 例 [J]. 图 书 情报 工作 ,2019 ,6 也 8 ) :127 一 


知识 融合 过 程 理 论 模 型 实证 分 析 
生物 科学 与 信息 科学 是 21 世纪 科学 技术 发 展 的 
制高点 ,二 者 经 过 知识 融合 形成 的 生物 信息 领域 具有 
战略 性 新 兴 产 业 科 学 技术 的 显著 特征 ,是 一 种 公认 的 


融合 新 兴 领 域 。 因 此 采用 生物 科学 与 信息 科学 经 知识 
融合 形成 生物 信息 领域 这 一 知识 融合 过 程 作为 实证 案 
例 来 实证 分 析 本 文 所 构建 的 采用 论文 引用 网 络 表征 的 
知识 融合 过 程 理 论 模 型 是 最 为 合适 的 。 
4.1 论文 引用 网 络 构 建 

按照 方法 框架 的 步骤 1, 由 和 若干 名 相关 领域 研究 
人 员 确 认 生 物 科 学 和 信息 科学 领域 的 关键 词 ,检索 年 
限 设 定 为 1995 - 2016 年 ,由 于 生物 信息 领域 最 先 在 美 
国产 生 ,为 了 降低 数据 噪音 将 检索 论文 的 范围 限定 在 
美国 。 所 制定 的 检索 式 为 "TS = ( (electrical compu- 


ting) or ( information technology systems) or ( engineering 


electrical electronic) or ( engineering industrial) or ( soft- 
ware engineering) or ( computer artificial intelligence) or 
(telecommunications ) or (computer hardware architec- 
ture), or (information technology) ) and CU = USA" fil 
"TS ( ( biochemistry molecular biology) or ( pharmacolo- 
gy-pharmacy) or (biochemical research methods) or ( ge- 
néties biology ) or ( biochemistry molecular biology) or 
( Biotechnology) or ( chemistry medicinal) or ( microbiolo- 
sg and CU = USA" , Æ WOS 中 的 SCI- EXPANDED, 
SSOD, A&HCI 论文 数据 库 根 据 上 述 检索 条 件 分 别 进行 
论文 检索 ,检索 结果 包含 生物 领域 论文 24 319 篇 , 信 


CDA 


息 领域 论文 52 254 篇 。 提 取 两 个 科学 领域 全 部 论文 
数据 集中 论文 间 的 直接 引用 信息 ,分 别 构建 每 年 的 论 
文 引用 网 络 时 间 序 列 。 

4.2. 实证 分 析 结 果 

根据 理论 模型 在 知识 融合 不 同 阶段 的 状态 特征 ， 
采用 所 提出 的 验证 方法 对 生物 科学 与 信息 科学 经 知识 
融合 形成 生物 信息 领域 的 过 程 进 行 分 析 并 与 理论 模型 
进行 匹配 ,完成 知识 融合 过 程 理论 模型 的 实证 分 析 过 
程 。 

在 论文 引用 网 络 可 视 化 结果 中 ,生物 科学 的 论文 
节点 显示 为 绿色 ,信息 科学 的 论文 节点 显示 为 红色 。 
采用 CDA 软件 对 每 年 的 论文 引用 网 络 拓扑 聚 类 并 进 
行 可 视 化 ,根据 可 视 化 结果 ,生物 科学 与 信息 科学 领域 
在 1998 年 之 前 论文 间 的 引用 均 为 领域 内 的 引用 ,不 存 
在 路 领域 引用 ,拓扑 聚 类 划分 的 篮 团 均 为 生物 科学 和 
信息 科学 领域 各 自 对 应 的 篮 团 ,说明 在 1998 年 之 前 生 
物 科学 与 信息 科学 领域 的 知识 流动 为 各 自 领域 内 的 知 
识 流动 。 根 据 可 视 化 结果 ,在 1998 年 开始 出 现 少量 的 
跨 领 域 引用 ,但 经 融合 篮 团 识别 在 1998 年 未 出 现 融合 
篮 团 , 则 说 明 到 了 1998 年 开始 出 现 领域 间 的 知识 流 
动 ,但 此 时 尚未 融合 形成 新 的 领域 ,1997 年 与 1998 年 
的 论文 引用 网 络 可 视 化 结果 见 图 6。 根据 论文 引用 网 
络 在 知识 融合 过 程 不 同 阶段 的 状态 特征 ,生物 科学 与 
言 息 科 学 领域 间 的 知识 融合 过 程 在 1998 年 从 知识 融 
合 过 程 的 的 第 1 阶段 进入 到 第 2 阶段 。 


S 


6 1997 年 与 1998 年 论文 引用 网 络 可 视 化 结果 


采用 CDA 软件 对 1998 年 之 后 的 论文 引用 网 络 拓 
扑 聚 类 并 进行 可 视 化 ,根据 可 视 化 结果 ,生物 科学 与 信 
息 科学 领域 在 1998 年 与 2003 年 之 间 , 论 文 间 跨 领域 


未 出 现 融 合 篮 团 ,说 明 1998 年 与 2003 年 之 间 领 域 间 
的 知识 流动 程度 不 断 加 深 , 但 尚未 融合 形成 新 的 领域 ; 
在 2003 年 ,论文 间 跨 领域 引用 的 数量 达到 一 定数 量 ， 


引用 的 数量 不 断 增多 ,2003 年 之 前 拓扑 聚 类 划分 的 篮 
团 均 为 生物 科学 和 信息 科学 领域 各 自 对 应 的 簇 团 ,并 


经 融合 篮 团 识别 结果 ,论文 引用 网 络 中 除了 生物 科学 
和 信息 科学 领域 各 自 对 应 的 簇 团 ,开始 出 现 一 个 包含 
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两 种 不 同 科 学 领域 的 论文 , 即 融合 篮 团 , 则 说 明 到 了 
2003 年 生物 科学 和 信息 科学 经 知识 融合 开始 出 现 新 
的 研究 范式 并 形成 新 的 融合 领域 。1999 年 与 2003 年 
的 论文 引用 网 络 可 视 化 结果 见 图 7,2003 年 出 现 的 融 
合 复 团 在 可 视 化 结果 中 鸭 出 。 在 2003 年 共识 别 出 4 


个 簇 团 ,融合 簇 团 中 生物 科学 领域 论文 占 比 61.3% , 
其 他 三 个 簇 团 生 物 科学 领域 占 比分 别 为 99.9% 0.9% 
和 1.8% ,融合 簇 团 包含 两 种 领域 论文 的 均匀 程度 远 
大 于 其 他 簇 团 。 


7 1999 年 与 2003 年 论文 引用 网 络 可 视 化 结果 


为 了 确定 融合 篮 团 所 对 应 的 科学 领域 ,首先 采用 


组 测序 ,2000 年 6 月 24 日 世界 各 国 参与 HCP 的 6 个 


Tip AREAS 2003 年 之 后 每 年 论文 引用 网 络 中 的 融 
从 复 团 ,根据 识别 结果 ,从 2003 年 至 2016 年 每 年 的 论 
文 引 用 网 络 中 均 识 别 到 1 个 融合 簇 团 ,2008 年 与 2016 
站 的 论文 引用 网 络 可 视 化 结果 见 图 8 ,识别 出 的 融合 
PAER S 中 圈 出 ;之 后 采用 LDA 主题 模型 提取 每 年 
融会 徐 团 中 论文 的 主题 词 ,提取 出 的 主题 词 见 表 2; 最 
后 结合 生物 信息 领域 的 主题 词 分 析 生 物 信息 领域 从 形 
成 以 来 的 演化 过 程 。 生 物 信息 学 的 主要 研究 课题 有 基 
因 组 学 蛋白质 组 学 .生物 芯片 等 。 根 据 生 物 信息 领域 
fed ZR ,生物 信息 学 的 兴起 始 于 20 世纪 70 
HERR, JA 20 世纪 70 年 代 初 到 80 年 代 出 现 了 许多 生物 
信息 学 分 析 方 法 和 生物 信息 学 数据 库 。 国 际 人 类 基因 
组 计划 (HGP) 于 1990 年 启动 ,在 生命 科学 领域 被 称 为 
阿波 罗 登 月 着 陆 计划 ,1995 年 完成 了 第 一 次 细菌 基因 


E 


司 家 研究 机 构 同 时 宣布 了 一 份 工作 草案 的 完成 ,与 此 
同时 ,生物 信息 学 在 HGP 的 推动 下 迅速 发 展 。 结 合 

2 中 主题 词 的 识别 结果 ,在 2003 年 出 现 基 因 世 片 相 关 
的 主题 词 ( gene , expression , microarray 等 ) ;在 2004 年 
出 现 生物 信息 数据 库 相 关 的 主题 词 (database , gene ex- 
pression protein data 等 ) ;在 2008 年 之 后 则 开始 出 现 人 
类 基因 组 测序 相关 的 主题 词 ( gene. human. database se- 
quencing 等 ) 。 主 题词 的 演化 过 程 符合 生物 信息 领域 
的 形成 和 演化 过 程 ,说 明 融 合 簇 团 对 应 的 则 为 融合 形 
成 的 生物 信息 领域 。 根 据 论文 引用 网 络 在 知识 融合 过 
程 不 同 阶段 的 状态 特征 ,生物 科学 与 信息 科学 领域 间 
的 知识 融合 过 程 在 2003 年 从 知识 融合 过 程 的 的 第 2 
阶段 进入 到 第 3 阶段 。 


8 2008 年 与 2016 年 论文 引用 网 络 可 视 化 结果 
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以 生物 信息 领域 为 例 [J]. BERRI 


R2 融合 簇 团 论文 题目 主题 词 


Æ h AAA E 证 BET 

Eh MRH E] 

2003 gene expression analysis profiling microarray discovery data protein 

2004 database drug gene expression protein data information microarray 

2008 gene human database sequencing biochemistry analysis microarray 
protein 

2012 gene human analysis sequencing information database proteomics 
data 

2016 sequencing data analysis genetic human database applications ex- 
pression 


根据 上 述 分 析 结果 ,生物 科学 与 信息 科学 的 知识 
融合 过 程 可 以 被 划分 为 知识 融合 理论 模型 中 的 3 个 阶 
段 ,其 中 1995 年 至 1998 年 处 于 知识 融合 理论 模型 的 
第 1 阶段 ,1998 年 至 2003 年 处 于 知识 融合 理论 模型 的 
第 2 阶段 ,2003 年 至 今 处 于 知识 融合 理论 模型 的 第 3 
阶段 ,同时 从 2003 年 开始 所 提取 融合 徐 团 的 主题 词 与 
生物 信息 领域 相对 应 ,并 且 主 题词 随 年 份 的 变化 反映 
绷 物 信息 领域 的 形成 和 演化 过 程 。 根 据 实证 分 析 结 
如 以 得 出 生物 科学 与 信息 科学 经 知识 融合 形成 生物 
侨 域 这 一 知识 融合 过 程 符合 所 构建 的 采用 论文 引 
FE 知识 融合 过 程 的 理论 模型 的 描述 。 

此 外 ,根据 实证 分 析 结 果 , 生 物 科学 与 信息 科学 经 


Ec 


模 剂 的 第 2 阶段 历经 6 年 时 间 , 即 从 发 生 领 域 间 的 知 
识 流动 到 形成 新 的 科学 领域 所 经 历 的 时 间 较 长 。 在 原 
存 理 论 模型 中 未 分 析 融 合 领 域 形成 经 历 的 时 间 , 实 证 
结果 中 的 这 一 发 现 从 知识 融合 过 程 各 阶段 所 经 历 
LE 论 模型 进行 了 完善 。 


本 文 从 知识 流动 和 领域 描述 的 角度 构建 了 一 个 采 
用 论文 引用 网 络 表征 知识 融合 过 程 的 理论 模型 ,并 采 
用 论文 引用 网 络 可 视 化 与 拓扑 聚 类 相 结合 的 验证 方法 
在 融合 新 兴 领 域 生物 信息 对 构建 的 理论 模型 进行 验 
证 。 主 要 得 出 以 下 结论 :中 根据 生物 信息 领域 的 实证 
分 析 结 果 证 明了 本 文 构建 的 采用 论文 引用 网 络 表征 的 
知识 融合 过 程 理论 模型 的 有 效 性 ; 忆 知 识 融 合 过 程 根 
据 论 文 引 用 网 络 中 的 表征 可 以 被 划分 为 三 个 阶段 , 且 
在 每 个 阶段 具有 不 同 的 特征 ;@ 采 用 论文 引用 网 络 可 
视 化 与 拓扑 聚 类 相 结合 的 方法 能 够 有 效 的 描述 知识 融 
合 的 过 程 。 需 要 说 明 的 是 ,本 文 主要 从 科学 推动 的 角 
度 描述 新 兴 科 学 领域 知识 融合 的 过 程 ,但 是 除 此 之 外 ， 
一 个 领域 的 形成 与 发 展 必 然 还 会 受到 经 济 发 展 、 市 场 
需求 .国家 政策 等 因素 的 影响 ,这些 因素 如 何 影 响 融 合 


型 新 兴 科 学 领域 的 形成 并 不 在 本 文 的 讨论 范围 内 。 
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Abstract. [ Purpose/significance | Technology fusion is the driving force of new industries" formation and develop- 


ment. While the knowledge fusion is the prerequisite of technology convergence, it is of great significance in guiding the 


formation and development of new industries. [ Method/process | Firstly, this paper built a theoretical model which using 


the citation network to characterize the knowledge fusion process based on the existing research. Then, based on the char- 


acteristics of paper citation network in each stage of knowledge fusion, the paper introduced a verification method. Final- 


ly, it conducted an empirical analysis in the field of bio-information technology. [ Result/ conclusion | The results of em- 


pirical analysis in the field of biological information show the validity of the theoretical model. Therefore, It can be 


deemed as a new method on studying the knowledge fusion. 
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